home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / doc / www_talk.arc / 000404_connolly@pixel.convex.com _Mon Nov 30 14:14:14 1992.msg < prev    next >
Internet Message Format  |  1992-11-30  |  4KB

  1. Return-Path: <connolly@pixel.convex.com>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA01580; Mon, 30 Nov 92 14:14:14 MET
  4. Received: by dxmint.cern.ch (5.65/DEC-Ultrix/4.3)
  5.     id AA18736; Mon, 30 Nov 1992 14:27:07 +0100
  6. Received: from pixel.convex.com by convex.convex.com (5.64/1.35)
  7.     id AA09143; Mon, 30 Nov 92 07:27:03 -0600
  8. Received: from localhost by pixel.convex.com (5.64/1.28)
  9.     id AA05269; Mon, 30 Nov 92 07:27:02 -0600
  10. Message-Id: <9211301327.AA05269@pixel.convex.com>
  11. To: www-talk@nxoc01.cern.ch
  12. Subject: An HTML specification and Implementors' Guide
  13. Date: Mon, 30 Nov 92 07:27:01 CST
  14. From: Dan Connolly <connolly@pixel.convex.com>
  15.  
  16.  
  17. I just uploaded
  18.  
  19. html_spec-0.3.tar.Z
  20.  
  21. to info.cern.ch in pub/incoming.
  22.  
  23. It's hypertext including
  24.  
  25. * MarkUp.html -- the root node
  26. * Text.html -- an introduction to SGML syntax
  27. * html.dtd -- the spec expressed in HTML
  28. * several example files that form a validation suite
  29. * libHTML.tar -- some code that implements the low-level
  30.         SGML reading state machine (with a test driver)
  31.  
  32. Tim: please link this into the web somehow.
  33.  
  34. Implementors: please grab the whole thing and validate
  35. your implementation against it.
  36.  
  37. Tony: I've got some patches for the MidasWWW browser.
  38. I'm not quite done cleaning them up.
  39.  
  40. Linemode fans: I haven't started messing with linemode
  41. yet.
  42.  
  43. Issues Closed Pending Review:
  44.  
  45. Long Names
  46.  
  47. I included an SGML declaration that increases NAMELEN to 34,
  48. and LITLEN to 1024. I got these numbers from the DocBook DTD.
  49.  
  50.  
  51. SGML IDs for Anchor Names
  52.  
  53. The NAME attribute of the A element is an ID. It must start
  54. with a name, and it must be unique among all the IDs in
  55. the document. [Note that there is no way to validate the #anchor
  56. part of the HREF attribute. I'm working on that...]
  57.  
  58.  
  59. Multimedia Links
  60.  
  61. I included a content-type attribute for links so that you can tell the
  62. browser what type of data you're pointing to, and it can decide what to
  63. do with it (at a minimum, use this attribute and pass the data to
  64. metamail). I added a content-description attribute in case you want the
  65. reader to be able to get some information about the data without
  66. transfering it, but now I'm not sure it's a good idea. The description
  67. should go in the content of the A element.
  68.  
  69.  
  70. Formatted Text with Anchors
  71.  
  72. I took the semantics of the PRE tag, added the WIDTH attribute, and
  73. called it TYPEWRITER (inspired by the nroff man page). It's parsed like
  74. most other elements, but displayed like XMP or LISTING or PLAINTEXT.
  75.  
  76. Newline handling isn't a parsing issue -- it's a display issue. I think
  77. it will be more straightforward to define newlines in TYPEWRITER
  78. content to be significant. That way, once the data is parsed, XMP
  79. and TYPEWRITER work just the same. Lines may get real long. That's
  80. life. If you want to mail it, use MIME or uuencode or something.
  81.  
  82. XMP and LISTING elements are CDATA: they have no markup in their
  83. content. There's no way to put </TITLE> inside an XMP element.
  84.  
  85. PLAINTEXT is an empty element that signals the end of a text/html
  86. entity and begins a text/plain entity.
  87.  
  88.  
  89. Ordered Lists
  90.  
  91. I included them in the DTD. Any objections?
  92.  
  93.  
  94. ISO Latin 1 Characters:
  95.  
  96. I included a reference to "ISO 8879:1986//ENTITIES Added Latin 1//EN"
  97. in the HTML DTD. This defines entities for all ISO latin 1 characters.
  98. Clients will need a table of the names and local translations.
  99.  
  100.  
  101. Open Issues:
  102.  
  103. Highlighting: Who's tags should we use? LaTeX seems to be an adequate
  104. markup system for lots of folks. Its tags are
  105.     em | it | bf | sf | sl | tt
  106.  
  107. The DocBook folks use only semantic tags: they don't have bold or italic
  108. tags. The MIME richtext stuff has only typographic tags: no <emphasis>
  109. or <booktitle> or any such thing.
  110.  
  111. Dan